在本文中,我们将概述SV形式共享任务,作为第三届学术文档处理(SDP)的一部分,在Coling 2022.中,在共同的任务中,为参与者提供了变量和变量的词汇,被要求确定全文学术文档中的单个句子中提到了哪些变量。两支球队总共向共享任务排行榜提交了9项意见。尽管所有团队都没有改进基线系统,但我们仍然从他们的意见书中获取见解。此外,我们提供了详细的评估。我们共享任务的数据和基线可在https://github.com/vadis-project/sv-inend上免费获得
translated by 谷歌翻译
社会人口统计学因素(例如性别或年龄)塑造了我们的语言。先前的工作表明,合并特定的社会人口统计学因素可以一致地改善传统NLP模型中各种NLP任务的性能。我们调查了这些先前的发现是否仍然存在于最先进的经过预审预测的变压器。我们使用三种常见的专业方法证明有效地将外部知识纳入预验证的变压器(例如,特定于领域的特定地理知识)。我们使用连续的语言建模和动态多任务学习来适应语言表示,以适应性别和年龄的社会人口统计学维度,以适应,我们将语言建模与社会人口统计学类的预测相结合。使用多语言模型时,我们的结果显示了四种语言(英语,德语,法语和丹麦语)的大量表现。这些发现符合先前工作的结果,并有望成功进行社会人口统计学专业化。但是,控制诸如领域和语言之类的混杂因素表明,尽管社会人口统计学适应确实改善了下游的表现,但收益并不总是源于社会人口统计学知识。我们的结果表明,社会人口统计学专业化虽然非常重要,但在NLP中仍然是一个尚未解决的问题。
translated by 谷歌翻译
虽然审慎的语言模型(PLM)主要用作通用文本编码器,可以对各种下游任务进行微调,但最近的工作表明它们也可以重新连接以产生高质量的单词表示(即静态单词)嵌入)并在类型级词汇任务中产生良好的性能。虽然现有的工作主要集中在单语和双语环境中PLM的词汇专业化,但在这项工作中,我们将大规模多语言变压器(例如MMTS,例如Mbert或XLM-R)公开,以此为大规模的多语言词法知识,并利用Babelnet作为易于获得的丰富来源。多语言和跨语性类型级词汇知识。具体来说,我们利用Babelnet的多语言合成器来创建$ 50 $语言的同义词对,然后对MMTS(Mbert和XLM-R)进行对比目标指导的词汇专业化程序。我们表明,如此庞大的多语言词汇专业化为两项标准的跨语性词汇任务,双语词典感应和跨语性单词相似性以及跨语性句子检索带来了巨大的收益。至关重要的是,我们观察到在专业化中看不见的语言的收益,表明多语言词汇专业化使得概括无词法约束。在一系列随后的受控实验中,我们证明了MMT对专业化语言中单词表示的预处理质量对性能的影响要比一组约束集的语言多样性更大。令人鼓舞的是,这表明涉及低资源语言的词汇任务从资源丰富的语言的词汇知识中受益最大,通常更多。
translated by 谷歌翻译
从文本中提取过程是过程发现的重要任务,近年来已经开发了各种方法。但是,与其他信息提取任务相反,缺乏商业流程描述的金标准库,这些文献对所有感兴趣的实体和关系仔细注释。因此,目前很难以客观的方式比较通过提取方法获得的结果,而缺乏带注释的文本也阻止了数据驱动的信息提取方法的应用,这是自然语言处理领域的典型特征。因此,为了弥合这一差距,我们介绍了PET数据集,这是用活动,网关,参与者和流程信息注释的业务流程描述的第一个语料库。我们介绍了我们的新资源,包括各种基线,以基准从文本中提取业务流程的困难和挑战。可以通过huggingface.co/datasets/patriziobellan/pet访问宠物
translated by 谷歌翻译
在这项工作中,我们提出了一个系统的实证研究,专注于最先进的多语言编码器在跨越多种不同语言对的交叉语言文档和句子检索任务的适用性。我们首先将这些模型视为多语言文本编码器,并在无监督的ad-hoc句子和文档级CLIR中基准性能。与监督语言理解相比,我们的结果表明,对于无监督的文档级CLIR - 一个没有针对IR特定的微调 - 预训练的多语言编码器的相关性判断,平均未能基于CLWE显着优于早期模型。对于句子级检索,我们确实获得了最先进的性能:然而,通过多语言编码器来满足高峰分数,这些编码器已经进一步专注于监督的时尚,以便句子理解任务,而不是使用他们的香草'现货'变体。在这些结果之后,我们介绍了文档级CLIR的本地化相关性匹配,在那里我们独立地对文件部分进行了查询。在第二部分中,我们评估了在一系列零拍语言和域转移CLIR实验中的英语相关数据中进行微调的微调编码器精细调整的微调我们的结果表明,监督重新排名很少提高多语言变压器作为无监督的基数。最后,只有在域名对比度微调(即,同一域名,只有语言转移),我们设法提高排名质量。我们在目标语言中单次检索的交叉定向检索结果和结果(零拍摄)交叉传输之间的显着实证差异,这指出了在单机数据上训练的检索模型的“单声道过度装备”。
translated by 谷歌翻译
在过去的十年中,通过深度学习方法取得了杰出的结果,对单一语言的语音情感识别(SER)取得了显着的结果。但是,由于(i)源和目标域分布之间的巨大差异,(ii)少数标记和许多未标记的新语言的话语,跨语言SER仍然是现实世界中的挑战。考虑到以前的方面,我们提出了一种半监督学习方法(SSL)方法,用于跨语性情感识别时,当有一些新语言的标签可用时。基于卷积神经网络(CNN),我们的方法通过利用伪标记的策略来适应新语言。特别是,研究了使用硬和软伪标签方法的使用。我们在源和新语言上均独立于语言的设置中彻底评估了该方法的性能,并在属于不同语言菌株的五种语言中显示出其稳健性。
translated by 谷歌翻译
阿拉伯联合酋长国阿布扎比技术创新研究所最近完成了一辆新的无人面车辆的生产和测试,称为Nukhada,专门用于自主调查,检查和对水下行动的支持。此稿件描述了Nukhada USV的主要特征,以及在开发期间进行的一些试验。
translated by 谷歌翻译
氢化镁(MGH $ _2 $)已被广泛研究有效储氢。然而,其散装解吸温度(553 k)被认为是实际应用的太高。除了掺杂外,可以降低这种用于释放氢的这种反应能量的策略是使用MGH $ _2 $基本的纳米颗粒(NPS)。在这里,我们首先调查Mg $ _N $ H $ _ {2n} $ NPS($ N <10 $)的热力学特性,特别是通过评估对焓,熵和热膨胀的anharmonic影响随机自我一致的谐波近似(SSCHA)。后一种方法超出了先前的方法,通常基于分子力学和准谐波近似,允许AB初始自由能量计算。我们发现了几乎线性依赖于间隙键长度的温度 - 具有超过300k的相对变化,与Mg-H键的键距离降低。为了将NPS的大小增加到MGH $ _2 $的氢解吸的实验中,我们设计了培训的计算有效的机器学习模型,以准确地确定力量和总能量(即潜在能量表面),与SSCHA模型集成了后者完全包括anharmonic效应。我们发现亚纳米簇Mg $ _n $ h $ _ {2n} $以$ n \ leq 10 $的显着减少,但不可忽视,虽然因anharmonicities(最多) 10%)。
translated by 谷歌翻译
We are witnessing a widespread adoption of artificial intelligence in healthcare. However, most of the advancements in deep learning (DL) in this area consider only unimodal data, neglecting other modalities. Their multimodal interpretation necessary for supporting diagnosis, prognosis and treatment decisions. In this work we present a deep architecture, explainable by design, which jointly learns modality reconstructions and sample classifications using tabular and imaging data. The explanation of the decision taken is computed by applying a latent shift that, simulates a counterfactual prediction revealing the features of each modality that contribute the most to the decision and a quantitative score indicating the modality importance. We validate our approach in the context of COVID-19 pandemic using the AIforCOVID dataset, which contains multimodal data for the early identification of patients at risk of severe outcome. The results show that the proposed method provides meaningful explanations without degrading the classification performance.
translated by 谷歌翻译
Human Activity Recognition (HAR) is one of the core research areas in mobile and wearable computing. With the application of deep learning (DL) techniques such as CNN, recognizing periodic or static activities (e.g, walking, lying, cycling, etc.) has become a well studied problem. What remains a major challenge though is the sporadic activity recognition (SAR) problem, where activities of interest tend to be non periodic, and occur less frequently when compared with the often large amount of irrelevant background activities. Recent works suggested that sequential DL models (such as LSTMs) have great potential for modeling nonperiodic behaviours, and in this paper we studied some LSTM training strategies for SAR. Specifically, we proposed two simple yet effective LSTM variants, namely delay model and inverse model, for two SAR scenarios (with and without time critical requirement). For time critical SAR, the delay model can effectively exploit predefined delay intervals (within tolerance) in form of contextual information for improved performance. For regular SAR task, the second proposed, inverse model can learn patterns from the time series in an inverse manner, which can be complementary to the forward model (i.e.,LSTM), and combining both can boost the performance. These two LSTM variants are very practical, and they can be deemed as training strategies without alteration of the LSTM fundamentals. We also studied some additional LSTM training strategies, which can further improve the accuracy. We evaluated our models on two SAR and one non-SAR datasets, and the promising results demonstrated the effectiveness of our approaches in HAR applications.
translated by 谷歌翻译